---
title: "Projeto INOVA FIOCRUZ 2020 - Análise geográfica da Cobertura Vacinal e a ocorrência do Sarampo no Brasil, 2000-2019"
output: 
  flexdashboard::flex_dashboard:
    storyboard: true
    social: menu
    source: embed # opcao para o código aparecer   
---

```{r setup, include=FALSE}
library(knitr)
options(max.print="75")
knitr::opts_chunk$set(echo=FALSE,
               cache=TRUE,
               prompt=FALSE,
               tidy=TRUE,
               comment=NA,
               message=FALSE,
               warning=FALSE,
               cache.lazy=FALSE)
knitr::opts_knit$set(width=75)

```

```{r}
library(flexdashboard)
library(ggplot2)
library(readxl)
library(plotly)
library(ggmap)

library(zoo)
library(questionr)
library(lubridate)
library(stringi)
library(dplyr)

library(geobr)
library(tmap)
library(sf)

library(hrbrthemes)
library(viridis)

# devtools::install_github('rstudio/rmarkdown@3953abd473e9230faca4dcad996d5d1b35c3b3a7')
# devtools::install_github('gagolews/stringi')
# devtools::install_github("rpradosiqueira/brazilmaps")
# https://github.com/sagarkulkarny/HR-Movement-Dashboard-using-Flexdashboard-

```


Inputs {.sidebar}
-----------------------------------------------------------------------

**Análise geográfica da Cobertura Vacinal e a ocorrência
do Sarampo no Brasil, 2000-2019**

O presente estudo pretende investigar a cobertura vacinal com a ocorrência de casos de sarampo para
identificar regiões brasileiras com maior heterogeneidade na evolução temporal
e a distribuição geográfica da cobertura nacional da vacina dupla e tríplice viral.

Envolvidos:

**Coordenação:** 

- Yara Hökerberg ([yarahahr@ini.fiocruz.br]())

- Raquel  Vasconcelos ([raquel.vasconcellos@ini.fiocruz.br]())

**Equipe:**

- Lívia Moura ([lica.moura.lima@gmail.com]())

- Luan da Silva ([snoedasilva@gmail.com]())

- Sônia Regina Lambert ([sonia.lambert@ini.fiocruz.br]())

- Wagner Tassinari ([tassinari@ufrrj.br]())


```{r}
# lendo o arquivo com a cobertura or regioes
banco0 <- read.csv('bancos/cobvac_porregiao.csv',sep=';',dec=',')

regiao.map <- read_region(year=2018, showProgress = F)   # region

```

### Distribuição temporal da cobertura Vacinal da tríplice viral, Brasil e Regiões - 2000 a 2020.


```{r}
g1 <- ggplot(data=banco0,mapping= aes(x=ano,y=cobertura))+
  geom_line(mapping=aes(color=regiao),size=0.9)+
  labs(x= "ano",
       y="Cobertura vacinal (%)",
       title="")+
  geom_hline(yintercept=c(95),linetype="dotted",
             color = "red", size=0.3)+
  scale_x_continuous(breaks=c(2000:2020))+
  theme_classic()+
  scale_y_continuous(breaks=c(75,100,120))+
  scale_color_discrete(name="")+
  annotate("text", x = 2000, y = 93, label = "95%")

ggplotly(g1)
```



```{r}
banco1 <- subset(banco0, regiao != "Brasil")
banco2000 <- subset(banco1, ano==2000)
banco2001 <- subset(banco1, ano==2001)
banco2002 <- subset(banco1, ano==2002)
banco2003 <- subset(banco1, ano==2003)
banco2004 <- subset(banco1, ano==2004)

banco2000a2004 <- banco2000 %>%
  mutate(cobertura2000a2004 = (banco2000$cobertura + banco2001$cobertura + banco2002$cobertura + banco2003$cobertura +        banco2004$cobertura)/5,
         Ano = "2000 a 2004",
         code_region = case_when(
           regiao == "Norte" ~ 1,
           regiao == "Nordeste" ~ 2,
           regiao == "Sudeste" ~ 3,
           regiao == "Sul" ~ 4,
           regiao == "Centro oeste" ~ 5,),
         code_region = as.factor(code_region))

banco2005 <- subset(banco1, ano==2005)
banco2006 <- subset(banco1, ano==2006)
banco2007 <- subset(banco1, ano==2007)
banco2008 <- subset(banco1, ano==2008)
banco2009 <- subset(banco1, ano==2009)

banco2005a2009 <- banco2000 %>%
  mutate(cobertura2005a2009 = (banco2005$cobertura + banco2006$cobertura + banco2007$cobertura + banco2008$cobertura +        banco2009$cobertura)/5,
         Ano = "2005 a 2009",
         code_region = case_when(
           regiao == "Norte" ~ 1,
           regiao == "Nordeste" ~ 2,
           regiao == "Sudeste" ~ 3,
           regiao == "Sul" ~ 4,
           regiao == "Centro oeste" ~ 5,),
         code_region = as.factor(code_region))

banco2010 <- subset(banco1, ano==2010)
banco2011 <- subset(banco1, ano==2011)
banco2012 <- subset(banco1, ano==2012)
banco2013 <- subset(banco1, ano==2013)
banco2014 <- subset(banco1, ano==2014)

banco2010a2014 <- banco2000 %>%
  mutate(cobertura2010a2014 = (banco2010$cobertura + banco2011$cobertura + banco2012$cobertura + banco2013$cobertura +        banco2014$cobertura)/5,
         Ano = "2010 a 2014",
         code_region = case_when(
           regiao == "Norte" ~ 1,
           regiao == "Nordeste" ~ 2,
           regiao == "Sudeste" ~ 3,
           regiao == "Sul" ~ 4,
           regiao == "Centro oeste" ~ 5,),
         code_region = as.factor(code_region))

banco2015 <- subset(banco1, ano==2015)
banco2016 <- subset(banco1, ano==2016)
banco2017 <- subset(banco1, ano==2016)
banco2018 <- subset(banco1, ano==2018)
banco2019 <- subset(banco1, ano==2019)
banco2020 <- subset(banco1, ano==2020)

banco2015a2020 <- banco2000 %>%
  mutate(cobertura2015a2020 = (banco2015$cobertura + banco2016$cobertura + banco2017$cobertura + banco2018$cobertura +        banco2019$cobertura + banco2020$cobertura)/6,
         Ano = "2015 a 2020",
         code_region = case_when(
           regiao == "Norte" ~ 1,
           regiao == "Nordeste" ~ 2,
           regiao == "Sudeste" ~ 3,
           regiao == "Sul" ~ 4,
           regiao == "Centro oeste" ~ 5,),
         code_region = as.factor(code_region))
```

### Distribuição da cobertura Vacinal da tríplice viral, Brasil e Regiões - 2000 a 2020.

```{r}
g2 <- banco0 %>%
  ggplot(aes(y = cobertura, x = as.factor(ano))) + 
    geom_violin(aes(fill = as.factor(ano)),  
                 binaxis = "y",         
                 binwidth = 0.1,       
                 stackdir = "center"   
                 ) +
  geom_hline(yintercept=c(95),linetype="dotted",
             color = "red", size=0.3) +
  annotate("text", x = "2000", y = 93, label = "95%", col="red") +
    stat_summary(fun.y = median, fun.ymin = median, fun.ymax = median,
                 geom = "crossbar", width = 0.5) +
    ylab("Cobertura (%)") + xlab("Anos") +
   ggtitle("Distribuição da cobertura Vacinal da tríplice viral entre o Brasil e Regiões - 2000 a 2020") +
  theme_minimal()

ggplotly(g2)
```

### Distribuição da cobertura Vacinal da tríplice viral entre o Brasil e Regiões - 2000 a 2020.

```{r}
g3 <- banco0 %>%
  ggplot(aes(x=regiao, y=cobertura, fill=regiao)) +
    geom_boxplot() +
    scale_fill_viridis(discrete = TRUE, alpha=0.6) +
    geom_jitter(color="black", size=0.4, alpha=0.9) +
  geom_hline(yintercept=c(95),linetype="dotted",
             color = "red", size=0.3) +
  annotate("text", x = "Brasil", y = 93, label = "95%", col="red") +
    theme_ipsum() +
    theme(
      legend.position="none",
      plot.title = element_text(size=11)
    ) +
    ggtitle("Distribuição da cobertura Vacinal da tríplice viral entre o Brasil e Regiões - 2000 a 2020") +
    ylab("Cobertura (%)") + xlab("Regiões") 

ggplotly(g3)
```


### Distribuição Geográfica da cobertura vacinal pelo Brasil por grandes regiões por triênios 2000 a 2020.












































```{r}
# Baixando a malha das regioes

regiao.map$code_region <- as.factor(regiao.map$code_region)

banco2000a2020 <- cbind(banco2000a2004, banco2005a2009, banco2010a2014, banco2015a2020)
banco2000a2020 <- banco2000a2020 %>% select(cobertura2000a2004, cobertura2005a2009, cobertura2010a2014, cobertura2015a2020) %>%
  mutate(code_region = c("1","2","3","4","5"))

regiao.map2000a2020 <- merge(banco2000a2020, regiao.map, by="code_region") 

st_geometry(regiao.map2000a2020) <- st_geometry(regiao.map)

library(wesanderson)
pal <- wes_palette("Zissou1", 50, type = "continuous")

tmap_mode("view");
tm_shape(regiao.map2000a2020) +
  tm_polygons(col=c("cobertura2000a2004", "cobertura2005a2009", "cobertura2010a2014", "cobertura2015a2020"),
              breaks=c(85, 90, 95, 100, 105, 110, 115), border.col = "white", palette="Oranges",
              title.col = "name_region") +
  tm_facets(as.layers = TRUE)

# tm_shape(regiao.map2000a2020) +
#   tm_polygons(col=c("cobertura2000a2004", "cobertura2005a2009", "cobertura2010a2014", "cobertura2015a2020"), breaks=c(75, 85, 95, 110), border.col = "white", palette="Oranges") +
#     tm_facets(sync = TRUE, ncol = 2, nrow = 2) 
 

```

### IDH + Pop + Cobertura

```{r}
code_region <- c(1,2,3,4,5)
pop2010 <- c(15864454,	53081950,	80364410,	27386891,	12482963)
IDH <- c(0.667, 0.663, 0.766, 0.754, 0.757)
pop.idh2010 <- data_frame(code_region, pop2010, IDH)

pop.idh2010 <- merge(banco2015a2020, pop.idh2010, by="code_region") 

g5 <- ggplot(pop.idh2010, aes(x=IDH, y=cobertura2015a2020, size=pop2010, fill=regiao)) +
    geom_point(alpha=0.7, shape=21,  color="black") +
    scale_size(range = c(3, 12), name="População 2010") +
    scale_fill_viridis(discrete=TRUE, guide=FALSE, option="A") +
    theme_ipsum() +
  #  theme(legend.position="bottom") +
    ylab("Cobertura Vacinal 2015 a 2020 (%)") +
    xlab("IDH") 
  # theme(legend.position="none")

ggplotly(g5)
```